跨界共学实验室 | “传媒+大数据”会学什么?
/专业分享/
🕐 2021年8月8日
📚 主题:大数据让每个人或事物都能转化成数据
✍🏻 整理:胡世鑫
分享人:于若琳
目前就读于中国传媒大学数据科学与大数据技术专业(传媒大数据方向)。
以下为主讲人自述:
各位同学大家好,我叫于若琳,来自北京。目前就读于中国传媒大学数据科学与大数据技术传媒大数据方向。同时,我在中传新闻学院《新传时报》融合新闻组工作一年。
大家是否有看到过某音乐APP的相关推荐?是否有在购物APP上搜索某物品后被疯狂推荐?是否发现在生活中提到的东西会出现在用户的手机里?是否觉得身边处处都是潜在的数据。虽然我们可能不太了解其中的运行机制,但它们就是大数据。
关于大数据专业
在大家的印象里中传是一个文科院校,但中传其实有三个大数据相关的专业:数据科学与大数据技术、数据科学与大数据技术传媒大数据方向以及大数据管理与应用。今年增加了第四个是数据科学与大数据技术计算广告方向。
它们的名称看起来相似,其实四个之间有很多不一样的地方。
关于大数据监控。只要上网,我们的相关信息就会被相关公司收集。一般来讲,监控有两个层面,一个是宏观层面,比如监控市场行为,监控人员流动状况等,是根据大量数据统计出的情况;另一个是微观层面,比如道路上的违章监控,小区入口的监控等,这些是监控个体的行为。
第一个层面的监控其实并不可怕,因为是宏观的,只反映整体情况;第二个层面的监控具体到个体,就好像电视里经常放的,有人寄给你一些照片,是你在幼儿园门口接小孩的,或者发给你一些信息,说你什么时候住过哪家酒店,这个确实很可怕。因为可以利用你独特的信息,对你产生巨大的影响。
第二个层面的监控是复杂的,除了要收集每个人的数据外,还要按个人特点进行分析和使用,难度非常高,费时费力。但是,随着大数据和云计算技术的发展,可以通过技术手段个性化处理每个人的数据,并应用到每个人身上,最近很火的“大数据杀熟”就是个典型的例子。可以说,我们每个人都是社会的一份子,每时每刻都处于第一个层面的监控下,但并不一定处于第二个层面的监控,但是随着技术的进步,以后就难说了。不过这是法律和伦理层面的问题,不是技术问题。
大数据在技术层面是非常有利的。但对于个人的大数据监控,比如“大数据杀熟”这方面,不是一个技术能限制的问题,而是关于伦理和法律的问题。
下面和大家介绍一下各种大数据有什么区别。
用直观的语言来讲,大数据应该算是“数学+计算机+传媒”。
关于普通的数据科学与大数据技术,很多大学都有设立。而中传的普通数据科学与大数据技术专业的介绍,我从学校官网有摘录出来。
依托新工科和传媒大数据背景,培养德智体美劳全面发展的、具有良好的科学素养和社会责任感、具有扎实的计算机科学与技术及数据科学理论基础、具有系统的数据思维、具有宽广的国际视野、具有良好的创新能力和团队合作精神、具有可持续发展能力,能从事数据科学与大数据相关的研究、设计、开发以及综合应用的高级工程技术人才。能够在政府部门、互联网企业、广电传媒行业以及大数据相关应用行业从事数据科学研究、大数据应用开发、技术管理与咨询等工作,并能够继续攻读数据科学、计算机科学与技术及相关学科的后续学位。
中传的数据科学与大数据技术,和其他学校也是有所不同的。
其他学校基本上是数据,包括统计学和计算机的知识。但是中传的数据科学与大数据是偏向传媒类的。
中传传媒大数据专业主要培养学生的能力有:数据汇聚处理能力、数据挖掘分析能力、数据应用和管理能力等。毕业生能够在文化、科技和传媒等领域从事数据分析、数据研发、数据管理等工作。
关于专业课程。理工科学生需要学的一些基础类课程有高数、概率论、高等代数和数据统计等。
像C语言、C++、数据结构D是一些编程类的课程,这个对于普通理科的掌握要求不是很高。但是对于像计算机或软件工程专业的学生是需要学习并掌握相关的专业知识的,包括我们的大数据专业要求也是比较高的。
快乐地做数据新闻
刚入学的时候我还没有接触过数据和新闻这两方面,但是后来加入了中传新闻学院的《新传时报》。
这个学期一共参与完成了三篇数据新闻相关的文章,分别是关于期末周众生相、体测和螺蛳粉,很有意思。
做数据新闻之后,我发现它不是只做数据那么单一。数据新闻不仅需要你去爬取数据,从各种网站找,譬如国家统计局官网,然后再爬取数据,还要作图。
作图的时候会用到网上一些作图软件,把数据整理好之后,寻找数据中的利用价值,然后再做成图片。
做数据新闻是一个非常复杂的过程,要比单纯做新闻复杂。因为它需要理科和文科相结合的思维。
数据新闻《数说 | 期末众生相》这篇是我比较有成就感的,因为是我第一个报的选题,还被采用了,最后也发在了新传时报公众号上。
以《数说 | 期末众生相》为例。文中会展示期末考试的搜索及资讯指数的变化趋势。这是在百度指数中找到的,比如我们会把从9月1号到12月12号的数据标出来,然后爬取这个时间段的数据,然后做成图,它就会有一个比较直观的展示。并且不同的数据在选图上形式也是不一样的,像我们以前学过的折线图、面积图、饼状图、柱状图,但最终的呈现是依据数据来定的,所以图片之间有较大的区别。
在想期末众生相这个选题的时候,大家就会开始发散性思考,进行头脑风暴。以期末考试作为出发点,去想一些和期末考试相关的内容,比如挂科、哪个省份的学生最关心期末考试、期末考试的搜索变化趋势等。
大家最关注期末考试的什么?这种的话知乎上会有一些讨论,从中我们可以爬数据做词频统计,再可以做成词云图,包括形状也会有一些设计。
这篇文章一共8张图,一般一篇数据新闻七八张图片基本就够了。
关于数据可视化
数据可视化有三个方面,客观性、直观性和美观性。
例如,通过这个饼图我们没有办法直观的看出到底是A供货商多还是B供货商多,但是如果通过条形图来看的话,就会更加客观地了解到多少,就不会出现一些误解。
关于数据可视化,选择什么样的数据,选择什么样的图,也是需要去分析数据才能得出来的。表示少量数据时,可以通过文本来分析表达。
文本这个数据看起来更加直观,不会像这个柱状图没有办法强调出来20%和41%的区别。
美观性就是如果想要体现出这个数据价值的时候,还想有一些额外的价值,可以通过这个颜色的深浅,也就是单一颜色的不同饱和度来展现。
用12345这种数字来表示的东西,可以通过颜色深浅让它有一种对比。
关于数据可视化。像我们会用到花火或者wordart,可以把数据导进去。先把数据分析好,然后导入就可以选择一种喜欢的数据呈现方式。
但一般图都不会直接的展现出来,会再用PS进行美化。
入门大数据还需要了解什么?
关于编程,作为一个大数据专业的小白,我认为编程不是一个可以轻易掌握的东西,它不仅需要一定的数学基础和逻辑思维,同时也需要细心和耐心来不断地debug和修改程序,并且通过创新性思维来开发更好的程序。所以说,不管是学这个专业还是额外掌握一门技能,一定是“兴趣是最好的老师”,感兴趣才是学好它的前提,没有学会编程也不是多么可惜,学什么都有光明的未来!
关于行业发展潜力,知乎上某回答这么说:
数据科学与大数据技术专业有光明的就业前景。根据数据研究可以发现,预计到2025年全国大数据核心人才缺口将达到230万人。毕业生就业主要分布在互联网、金融、投资、证券、计算机软件、商业、贸易、教育、服务、政府、高校等领域。大数据专业对应岗位发展方向,下面简单列一些方向:
1、大数据开发对应职位:大数据工程师、大数据开发工程师、大数据维护工程师、大数据研发工程师、大数据架构师等;
2、数据挖掘、数据分析对应职位:大数据挖掘师、大数据分析师、大数据高级工程师、大数据分析师专家、大数据算法师等;
3、大数据运营维护和云计算方向对应职业:大数据运维工程师、高级大数据运维工程师。
大数据其实是一个分行业的大数据,它不只在一个专业,比如在金融方面需要数据分析,在计算机方面,一些软件运营维护上需要大数据分析,而不是把大数据分析专门列在一个行业里。
它需要依附一些行业来存在的,在别的行业的基础上去做的一些东西。
就中国市场而言,2020年大数据市场整体规模预计将首次超过100亿美元,较2019年同比增长15.9%,与上期预测基本一致。长期来看,中国大数据支出整体呈稳步增长态势,市场总量有望在2024年超过200亿美元,与2019年相比增幅达到145%。同时,中国大数据市场发展迅速,五年复合年均增长率约为19.7%,增速领跑全球。
对于我个人而言,选择大数据专业实属机缘巧合,在学习感受了一年时间后,更深入地了解了这个专业,我发现我自己更喜欢做数据与新闻结合的领域而非纯理工地进行数据分析。由于数据科学这个专业是依附于其他行业的,所以我打算在研究生能选择一个自己感兴趣的领域,实现“大数据+”的实践应用。
- END -
统筹总监|胡世鑫
值班编辑|黄水一
特别推荐阅读